{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {
    "collapsed": true,
    "ExecuteTime": {
     "start_time": "2025-09-26T10:19:50.744432Z",
     "end_time": "2025-09-26T10:19:51.771773Z"
    }
   },
   "outputs": [],
   "source": [
    "import pandas as pd\n",
    "# 运行前需要启动neo4j:neo4j.bat console 密码123456789\n",
    "from py2neo import Graph\n",
    "from py2neo import Node, Relationship\n",
    "import jieba\n",
    "# 连接数据库\n",
    "graph = Graph('bolt://localhost:7687', auth=('neo4j', '123456789'))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 35,
   "outputs": [
    {
     "data": {
      "text/plain": "     name                       alias    part  \\\n0      阳痿  勃起功能障碍 勃起机能障碍 勃起无力 阳萎 勃起不足      阴茎   \n1      乙肝                        乙型肝炎       肝   \n2      癫痫                     羊癫疯 羊角风      颅脑   \n3    月经不调                        月经失调   卵巢 子宫   \n4     颈椎病               颈椎退行性变 颈椎骨质增生      脊柱   \n5    腰肌劳损                           无      腰部   \n6    尿路感染                    尿感 泌尿道感染   阴茎 尿道   \n7   股骨头坏死        骨蚀 股骨头无菌性坏死 股骨头缺血性坏死  大腿 下肢骨   \n8   精神分裂症                           无      心理   \n9    早孕反应               妊娠剧吐 妊娠反应  惡阻      全身   \n10    食道癌                   食管癌 膈症 噎膈      食管   \n11    麦粒肿                  针眼 眼睑炎 睑腺炎       眼   \n12    鼻咽癌                         石上疽       鼻   \n13  急性胰腺炎                      胰腺炎 胰瘅      胰腺   \n14    胆囊炎                           无       胆   \n15  地中海贫血         地贫 海洋性贫血 珠蛋白生成障碍性贫血    血液血管   \n16  子宫内膜癌                    子宫体癌 子宫癌      子宫   \n17   动脉硬化                      动脉粥样硬化    血液血管   \n18    扁平疣                          瘊子      皮肤   \n19   神经衰弱                    神经衰弱症 神劳      全身   \n20    尿道炎                        尿道炎症      尿道   \n21   性欲亢进                   性欲过盛 性欲过旺      全身   \n22     哮喘                       支气管哮喘       肺   \n23    尿毒症                           无       肾   \n24     流产                          小产      子宫   \n25    低血压                        血压过低    血液血管   \n26    不孕症                不孕不育 不孕 女性不孕    女性生殖   \n27     肾虚                           无       肾   \n28  婴幼儿腹泻                       初生儿腹泻     胃 胃   \n\n                                         age infection insurance  department  \\\n0                                       成年男性      无传染性     非医保疾病     男科 生殖健康   \n1                   所有人群 主要见于青少年 绝大多数为10~30岁      有传染性     非医保疾病      传染科 肝病   \n2                                       所有人群      无传染性      医保疾病        神经内科   \n3                       女性 压力过大型 怕冷型 虚弱型 贫血型      无传染性     非医保疾病          妇科   \n4                               中 老年人  40岁以上      无传染性      医保疾病     骨科 神经内科   \n5                               长期保持坐姿者 中老年人      无传染性      医保疾病      外伤科 骨科   \n6                     育龄女性及绝经后妇女 糖尿病及高龄 免疫缺陷      无传染性      医保疾病        泌尿外科   \n7                                       中老年人      无传染性      医保疾病   骨科 中西医结合科   \n8                    青壮年 自卑者 工作压力大 抑郁的人大部分都会      无传染性      医保疾病        精神病科   \n9                                     妊娠早期孕妇      无传染性     非医保疾病          产科   \n10                                     中老年人群      无传染性      医保疾病    肿瘤科 消化内科   \n11                                       青年人      无传染性      医保疾病      眼科 中医科   \n12                                      中年人群      无传染性      医保疾病    肿瘤科 耳鼻喉科   \n13              所有人群 发生于妊娠的任何时期 以妊娠晚期及产褥期较多。      无传染性      医保疾病   消化内科 肝胆外科   \n14                                肥胖且多次妊娠的妇女      无传染性      医保疾病   肝胆外科 消化内科   \n15                                  所有人群 婴幼儿      无传染性      医保疾病      血液科 儿科   \n16                                围绝经期和绝经后女性      无传染性      医保疾病      肿瘤科 妇科   \n17                        青少年时期发生 中老年时期加重 发病      无传染性      医保疾病  心血管内科 心胸外科   \n18                             儿童青少年 亦常见于成人。      有传染性      医保疾病     皮肤科 中医科   \n19                            16到40岁 脑力劳动者多见      无传染性      医保疾病   神经内科 心理咨询   \n20                                所有人群 多见于女性      无传染性      医保疾病    肾内科 泌尿外科   \n21                                  中年 青年较多发      无传染性     非医保疾病   生殖健康 心理咨询   \n22                                      所有人群      无传染性      医保疾病    呼吸内科 中医科   \n23                                     中老年人群      无传染性      医保疾病         肾内科   \n24                                孕龄女性 怀孕准妈妈      无传染性      医保疾病          产科   \n25  所有人群 经常从事较大运动量的人群如体育运动员 重体力劳动者 而体型瘦长的年轻妇      无传染性      医保疾病       心血管内科   \n26                                 成年人群 孕龄女性      无传染性      医保疾病     生殖健康 妇科   \n27                  中老年人群尤其是40岁以上的人群 性生活多的男性      无传染性     非医保疾病     肾内科 中医科   \n28                                       婴幼儿      无传染性     非医保疾病     儿科 消化内科   \n\n                                            checklist  \\\n0             外生殖器检查 前列腺B超 阴茎超声检查 泌乳素分泌抑制试验 泌乳素兴奋试验     \n1   乙肝病毒学指标 凝血酶原时间 乙肝两对半 血清白蛋白与球蛋白比值 血清HBsAg免疫复合物 ...   \n2                    贝美格诱发试验 头颅平片 MRI 脑电图 脑血流灌注断层显像     \n3                       盆腔和阴道B超 宫颈癌筛查 妇科B超 宫腔镜 宫颈活检     \n4                         颈部活动度 椎间孔挤压试验 颈项强直 臂丛牵拉试验     \n5                       腰背部检查 脊柱压痛与叩击痛 拾物试验 腰背痛体格检查     \n6                   肾脏B超 放射性核素肾图 逆行肾盂造影 泌尿系统CT 尿路平片     \n7                  四肢的骨和关节平片 骨与关节MRI 4字试验 骨关节及软组织CT     \n8         正电子发射计算机断层扫描 颅脑MRI SPECT显像 脑代谢显像 脑蛋白质代谢显像     \n9                          尿酮体试验 尿酮体 产科B超 尿HCG 早孕试纸     \n10       胃部检查 上消化道功能测定和显像 色素内镜检查 血清肿瘤特异性生长因子 多药耐药基因     \n11                                                  无   \n12            颅底片 全身显像 鼻咽部MRI 正电子发射计算机断层扫描 血清EB病毒抗体     \n13       血清淀粉酶同工酶 血清脂肪酶 血清抗胰腺腺泡抗体 血清胰癌胚抗原 血清胰腺特异性抗原     \n14             胆道镜 胆囊胆道B超 肝脏及胆囊叩诊 肝 胆 脾CT 血清异枸橼酸脱氢酶     \n15          Hb-F碱变性试验 骨髓象分析 异常红细胞形态 红细胞检查 红细胞渗透脆性试验     \n16          生殖系统肿瘤检查项目 子宫颈涂片测试 子宫内膜活检 子宫输卵管造影 p53基因     \n17                    大生化检查 血流变学检查 动脉听诊 动脉血气分析 PaO2     \n18                                                  无   \n19                               心电图 脑电图 肌电图 脑多普勒超声     \n20              阴道毛滴虫检查 眼标本的细菌学检查 尿道口检查 尿道分泌物检查 尿常规     \n21                                       颅脑CT 性激素六项     \n22                      动脉血气分析 肺功能 PaO2 皮肤划痕试验 皮内试验     \n23                      氨基酸 阴离子隙 尿常规 血液生化六项 放射性核素肾图     \n24              阴道细胞学检查 盆腔和阴道B超 阴道镜 阴道分泌物涂片 缩宫素激惹试验     \n25             动态血压监测(ABPM) 血压测量 心电图 动态心电图 心脏血管超声检查     \n26       促黄体生成素 自身免疫抗体检测 不孕不育的免疫学检查 不孕不育检查 宫颈粘液相合试验     \n27                                          肾功能 尿常规     \n28                  便常规 胰腺外分泌功能试验 纤维结肠镜 呼气试验 粪便淀粉颗粒     \n\n                                             symptom  \\\n0                 心理性性功能障碍 男子性功能障碍 雄激素过少 精冷不育 脉涩或结     \n1   转氨酶增高 肝肿大 乙肝表面抗原（HBsAg）阳性 乙肝e抗原（HBeAg）阳性 肝功能异常     \n2                            四肢抽搐 反复高热 惊厥 昏睡 一过性昏厥     \n3                        月经量多 月经稀少 月经失调 子宫出血 小腹冷痛 头疼   \n4                       上肢麻痹 肩背痛 颈椎痛 头颈部活动受限 颈部僵硬 头疼   \n5                 腰酸 弯腰时腰痛 劳累时腰部酸痛或胀痛 腰酸背痛 产育过多后腰痛     \n6                  复杂性尿路感染 肾脓肿 反复不愈的尿道感染 尿液混浊 真性菌尿     \n7                           髋关节痛 间歇性跛行 大腿刺痛 大腿肌肉萎缩     \n8                        幻觉 思维破裂 思维紊乱 精神运动性兴奋 色情行为     \n9                      恶心与呕吐 尿频 食欲异常 尿妊娠试验阳性 早孕反应重     \n10                            梗噎 进食困难 吞咽困难 吞咽障碍 消瘦     \n11                    眼屎多 眼睑脓肿 睑结膜充血露出黄色脓块 眼睛发红 眼痛     \n12               耳内闭塞感 鼻内似有擤不出的鼻涕 张口呼吸 咽部异物感 鼻咽腔狭窄     \n13                  胰源性腹痛 突发性右上腹绞痛 恶心与呕吐 急腹症 上腹部压痛     \n14                           右上腹压痛 恶心 发烧 腹肌紧张 右上腹痛     \n15                     气血不足 脾肿大 头晕 皮肤呈浅黄或深金黄色 重度贫血     \n16                    阴道出血 阴道分泌物增多 下腹疼痛 下腹胀痛 下腹部包块     \n17                        头痛 心音异常 胸痛 头晕 动脉呈多处伸长扭曲状     \n18                                         皮肤瘙痒 丘疹     \n19                      易激惹 易疲乏 保持睡眠障碍性失眠 头痛 神经官能症     \n20                 尿道烧灼感 尿道痒感 白色黏液状尿 尿道刺痒 尿道口有白膜形成     \n21                               迷走神经兴奋 阴茎异常勃起 性上瘾     \n22                               鼻煽 喉鸣声 干咳 呼吸困难 喘息     \n23                   少尿 肾衰竭 食欲下降 双肾弥漫性病变 双下肢可凹陷性水肿     \n24       先兆流产 妊娠时伴有腹痛的阴道流血 自发性流产 难免流产或不可避免流产 习惯性流产     \n25                        头晕 无力 疲乏 心前区隐痛 蹲下起来后眼前发黑     \n26                  月经失调 阴道不规则出血 阴道分泌物增多 月经量多 月经稀少     \n27                            尿频 性欲减退 腰酸背痛 腰酸 月经失调     \n28                           粪便量多 发烧 失水 黄绿稀溏 电解质紊乱     \n\n                               complication              treatment  \\\n0                                         无            药物治疗 心理治疗     \n1                   肝性脑病 肝硬化 腹膜炎 消化道出血 肺炎              药物治疗 饮食疗法     \n2                       肾衰 急性早幼粒细胞白血病 抑郁症                   药物治疗     \n3                痛经 经前期综合征 多囊卵巢综合征 黄褐斑 粉刺                   药物治疗     \n4   食管压迫型颈椎病 椎动脉型颈椎病 脊髓型颈椎病 神经根型颈椎病 颈型颈椎病    药物治疗 理疗 手术治疗 中医针灸治疗     \n5                               筋膜炎 椎管狭窄症         药物治疗 物理治疗 手术治疗     \n6                    肾盂肾炎 肾炎 肾周围炎 尿路梗阻 血尿                   药物治疗     \n7                                 骨关节炎 瘫痪         西医治疗 中医治疗 手术治疗     \n8                                心脏病 心力衰竭                   药物治疗     \n9                                    食管穿孔                   药物治疗     \n10                  黄疸 吸入性肺炎 肥大性骨关节病 食管穿孔               手术治疗 放化疗     \n11                                        无            药物治疗 手术治疗     \n12                                        无            放射治疗 手术治疗     \n13                                        无            药物治疗 手术治疗     \n14   老年人胆囊炎 妊娠合并急性胆囊炎 急性胆囊炎 小儿急性胆囊炎 慢性胆囊炎              药物治疗 手术治疗     \n15                        肝硬化 贫血 肝炎 积聚 溶血                   药物治疗     \n16                        子宫肌瘤 多囊卵巢综合征 功血              药物治疗 手术治疗     \n17                        高血压 心绞痛 猝死 神经衰弱                   药物治疗     \n18                                        无            药物治疗 手术治疗     \n19                  月经不调 便秘 植物神经紊乱 阳痿 拉肚子              药物治疗 情绪疗法     \n20                  盆腔炎 前列腺炎 附睾炎 膀胱炎 尿道狭窄                   药物治疗     \n21                                   前列腺炎              心理治疗 药物治疗     \n22                    肺气肿 气胸 猝死 肺水肿 消化道出血                   药物治疗     \n23                    肺水肿 贫血 高血压 糖尿病 高钾血症     保守疗法 血液透析 腹膜透析 肾移植     \n24               失血性休克 休克 腹膜炎 败血症 盆腔结缔组织炎                   手术治疗     \n25                眩晕 心绞痛 尿道癌 人流后妇科病 女性尿道癌          西医药物治疗 中医治疗治疗     \n26              子宫肌瘤 阴道横隔 急性子宫内膜炎 乳腺增生 早泄       对症治疗 中医中药治疗 试管培养     \n27                    肾虚眩晕 肾虚腰痛 肾虚耳鸣 肾精亏虚                   药物治疗     \n28                   急性心力衰竭 心肌炎 肾衰 贫血 鹅口疮       营养不良 多种维生素缺乏 鹅口疮     \n\n                                  drug                 period  \\\n0        枸橼酸西地那非... 枸橼酸西地那非... 他达拉非片                    1-2个月   \n1         恩替卡韦分散片 碧云砂乙肝颗粒 注射用盐酸精氨...                     3-6月   \n2                普瑞巴林胶囊 奥卡西平片 左乙拉西坦片            >120天(需要终身治疗)   \n3                   定坤丹 加味益母草膏 艾附暖宫丸                    1-2个月   \n4                   消痛贴膏 颈腰康胶囊 颈复康颗粒                    3-6个月   \n5                   腰痛宁胶囊 腰息痛胶囊 消痛贴膏                       4周   \n6   盐酸左氧氟沙星... 盐酸头孢他美酯... 注射用盐酸左氧...                       2周   \n7            通络生骨胶囊 硫酸氨基葡萄糖... 活血健骨片                  30-100天   \n8               盐酸三氟拉嗪 盐酸氟奋乃静片 卡马西平片                      30天   \n9                     叶酸片 嗣育保胎丸 胎宝胶囊                    7-14天   \n10              云芝糖肽胶囊 复方天仙胶囊 去甲斑蝥素片                    1-3个月   \n11     复方磺胺甲噁唑... 头孢克洛干混悬... 熊胆黄芩滴眼液                     3-7天   \n12              平消胶囊 鼻咽灵片 转移因子口服溶...                    1-3个月   \n13      清胰利胆颗粒 醋酸奥曲肽注射... 醋酸奥曲肽注射...                        无   \n14  盐酸左氧氟沙星... 盐酸米诺环素胶... 盐酸左氧氟沙星...                  14--30天   \n15                    鱼鳞病片 参一胶囊 康逆胶囊                  1---3个月   \n16                     金鸡颗粒 金鸡片 金鸡胶囊                    1-3个月   \n17          活血通脉片 复方氨基丁酸维... 长春胺缓释胶囊                      3个月   \n18               转移因子胶囊 十三味菥蓂丸 五妙水仙膏                  28--42天   \n19                  天麻素胶囊 泻肝安神丸 益脑胶囊                     120天   \n20           复方石韦颗粒 磷霉素氨丁三醇... 解毒通淋丸                   15-30天   \n21                   抑亢丸 甲亢灵胶囊 甲亢灵颗粒                    1-2个月   \n22                盐酸氨溴索片 胆茶碱片 曲尼司特胶囊    15天(国内最认可的有效治疗手段的该病治疗   \n23         复方α-酮酸片 吗替麦考酚酯胶... 他克莫司胶囊                      6个月   \n24              孕康颗粒 注射用绒促性素 维生素E软胶囊                    7-30天   \n25           注射用左卡尼汀 注射用左卡尼汀 注射用左卡尼汀                    5-20天   \n26              地屈孕酮片 天紫红女金胶囊 散结镇痛胶囊                     2-3月   \n27                肾宝片 四子填精胶囊 蓉蛾益肾口服液                   10-30天   \n28              肠炎宁片 止痢宁片 复方小檗碱鞣酸...                        无   \n\n                       rate                                money  \n0      85%(一般经过有效治疗后可以缓解症状)                                    无  \n1                     0.00%               市三甲医院约（3000 —— 8000元）;  \n2                    暂无相关资料                市三甲医院约（3000 —— 8000元）  \n3                       69%                市三甲医院约（2000 —— 5000元）  \n4                       50%                                    无  \n5                       80%                市三甲医院约（1000 —— 3000元）  \n6                       90%                    市三甲医院约（500-1000元）  \n7                       20%  据不同医院 收费标准不一致 市三甲医院约（5000 —— 8000元）  \n8                       10%                 市三甲医院约（10000-50000元）  \n9                       95%                                    无  \n10                       3%                                    无  \n11                      98%                                    无  \n12                      10%                                    无  \n13                      80%                                    无  \n14                      90%                                    无  \n15                  30--60%                                    无  \n16                      40%                                    无  \n17                      70%                市三甲医院约（3000 —— 5000元）  \n18                      98%                 市三甲医院约（300 —— 500元）;  \n19   20%(一般在正规综合三甲医院的典型病例治愈                市三甲医院约（1000 —— 3000元）  \n20                      95%                      市三甲医院约200--500元  \n21                   70-80%                                    无  \n22  80%(当今的治疗手段可使接近80%的哮喘患者                  市三甲医院约（5000-10000元）  \n23          10%(治疗后80%可以好转)                市三甲医院约（50000-100000元）  \n24                      80%                                    无  \n25                      90%                 市三甲医院约（1000 —— 2000元  \n26        一般经过特殊治疗后 95%能够治愈                                    无  \n27                      80%                市三甲医院约（1000 —— 3000元）  \n28                     100%                                    无  ",
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>name</th>\n      <th>alias</th>\n      <th>part</th>\n      <th>age</th>\n      <th>infection</th>\n      <th>insurance</th>\n      <th>department</th>\n      <th>checklist</th>\n      <th>symptom</th>\n      <th>complication</th>\n      <th>treatment</th>\n      <th>drug</th>\n      <th>period</th>\n      <th>rate</th>\n      <th>money</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>0</th>\n      <td>阳痿</td>\n      <td>勃起功能障碍 勃起机能障碍 勃起无力 阳萎 勃起不足</td>\n      <td>阴茎</td>\n      <td>成年男性</td>\n      <td>无传染性</td>\n      <td>非医保疾病</td>\n      <td>男科 生殖健康</td>\n      <td>外生殖器检查 前列腺B超 阴茎超声检查 泌乳素分泌抑制试验 泌乳素兴奋试验</td>\n      <td>心理性性功能障碍 男子性功能障碍 雄激素过少 精冷不育 脉涩或结</td>\n      <td>无</td>\n      <td>药物治疗 心理治疗</td>\n      <td>枸橼酸西地那非... 枸橼酸西地那非... 他达拉非片</td>\n      <td>1-2个月</td>\n      <td>85%(一般经过有效治疗后可以缓解症状)</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>1</th>\n      <td>乙肝</td>\n      <td>乙型肝炎</td>\n      <td>肝</td>\n      <td>所有人群 主要见于青少年 绝大多数为10~30岁</td>\n      <td>有传染性</td>\n      <td>非医保疾病</td>\n      <td>传染科 肝病</td>\n      <td>乙肝病毒学指标 凝血酶原时间 乙肝两对半 血清白蛋白与球蛋白比值 血清HBsAg免疫复合物 ...</td>\n      <td>转氨酶增高 肝肿大 乙肝表面抗原（HBsAg）阳性 乙肝e抗原（HBeAg）阳性 肝功能异常</td>\n      <td>肝性脑病 肝硬化 腹膜炎 消化道出血 肺炎</td>\n      <td>药物治疗 饮食疗法</td>\n      <td>恩替卡韦分散片 碧云砂乙肝颗粒 注射用盐酸精氨...</td>\n      <td>3-6月</td>\n      <td>0.00%</td>\n      <td>市三甲医院约（3000 —— 8000元）;</td>\n    </tr>\n    <tr>\n      <th>2</th>\n      <td>癫痫</td>\n      <td>羊癫疯 羊角风</td>\n      <td>颅脑</td>\n      <td>所有人群</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>神经内科</td>\n      <td>贝美格诱发试验 头颅平片 MRI 脑电图 脑血流灌注断层显像</td>\n      <td>四肢抽搐 反复高热 惊厥 昏睡 一过性昏厥</td>\n      <td>肾衰 急性早幼粒细胞白血病 抑郁症</td>\n      <td>药物治疗</td>\n      <td>普瑞巴林胶囊 奥卡西平片 左乙拉西坦片</td>\n      <td>&gt;120天(需要终身治疗)</td>\n      <td>暂无相关资料</td>\n      <td>市三甲医院约（3000 —— 8000元）</td>\n    </tr>\n    <tr>\n      <th>3</th>\n      <td>月经不调</td>\n      <td>月经失调</td>\n      <td>卵巢 子宫</td>\n      <td>女性 压力过大型 怕冷型 虚弱型 贫血型</td>\n      <td>无传染性</td>\n      <td>非医保疾病</td>\n      <td>妇科</td>\n      <td>盆腔和阴道B超 宫颈癌筛查 妇科B超 宫腔镜 宫颈活检</td>\n      <td>月经量多 月经稀少 月经失调 子宫出血 小腹冷痛 头疼</td>\n      <td>痛经 经前期综合征 多囊卵巢综合征 黄褐斑 粉刺</td>\n      <td>药物治疗</td>\n      <td>定坤丹 加味益母草膏 艾附暖宫丸</td>\n      <td>1-2个月</td>\n      <td>69%</td>\n      <td>市三甲医院约（2000 —— 5000元）</td>\n    </tr>\n    <tr>\n      <th>4</th>\n      <td>颈椎病</td>\n      <td>颈椎退行性变 颈椎骨质增生</td>\n      <td>脊柱</td>\n      <td>中 老年人  40岁以上</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>骨科 神经内科</td>\n      <td>颈部活动度 椎间孔挤压试验 颈项强直 臂丛牵拉试验</td>\n      <td>上肢麻痹 肩背痛 颈椎痛 头颈部活动受限 颈部僵硬 头疼</td>\n      <td>食管压迫型颈椎病 椎动脉型颈椎病 脊髓型颈椎病 神经根型颈椎病 颈型颈椎病</td>\n      <td>药物治疗 理疗 手术治疗 中医针灸治疗</td>\n      <td>消痛贴膏 颈腰康胶囊 颈复康颗粒</td>\n      <td>3-6个月</td>\n      <td>50%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>5</th>\n      <td>腰肌劳损</td>\n      <td>无</td>\n      <td>腰部</td>\n      <td>长期保持坐姿者 中老年人</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>外伤科 骨科</td>\n      <td>腰背部检查 脊柱压痛与叩击痛 拾物试验 腰背痛体格检查</td>\n      <td>腰酸 弯腰时腰痛 劳累时腰部酸痛或胀痛 腰酸背痛 产育过多后腰痛</td>\n      <td>筋膜炎 椎管狭窄症</td>\n      <td>药物治疗 物理治疗 手术治疗</td>\n      <td>腰痛宁胶囊 腰息痛胶囊 消痛贴膏</td>\n      <td>4周</td>\n      <td>80%</td>\n      <td>市三甲医院约（1000 —— 3000元）</td>\n    </tr>\n    <tr>\n      <th>6</th>\n      <td>尿路感染</td>\n      <td>尿感 泌尿道感染</td>\n      <td>阴茎 尿道</td>\n      <td>育龄女性及绝经后妇女 糖尿病及高龄 免疫缺陷</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>泌尿外科</td>\n      <td>肾脏B超 放射性核素肾图 逆行肾盂造影 泌尿系统CT 尿路平片</td>\n      <td>复杂性尿路感染 肾脓肿 反复不愈的尿道感染 尿液混浊 真性菌尿</td>\n      <td>肾盂肾炎 肾炎 肾周围炎 尿路梗阻 血尿</td>\n      <td>药物治疗</td>\n      <td>盐酸左氧氟沙星... 盐酸头孢他美酯... 注射用盐酸左氧...</td>\n      <td>2周</td>\n      <td>90%</td>\n      <td>市三甲医院约（500-1000元）</td>\n    </tr>\n    <tr>\n      <th>7</th>\n      <td>股骨头坏死</td>\n      <td>骨蚀 股骨头无菌性坏死 股骨头缺血性坏死</td>\n      <td>大腿 下肢骨</td>\n      <td>中老年人</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>骨科 中西医结合科</td>\n      <td>四肢的骨和关节平片 骨与关节MRI 4字试验 骨关节及软组织CT</td>\n      <td>髋关节痛 间歇性跛行 大腿刺痛 大腿肌肉萎缩</td>\n      <td>骨关节炎 瘫痪</td>\n      <td>西医治疗 中医治疗 手术治疗</td>\n      <td>通络生骨胶囊 硫酸氨基葡萄糖... 活血健骨片</td>\n      <td>30-100天</td>\n      <td>20%</td>\n      <td>据不同医院 收费标准不一致 市三甲医院约（5000 —— 8000元）</td>\n    </tr>\n    <tr>\n      <th>8</th>\n      <td>精神分裂症</td>\n      <td>无</td>\n      <td>心理</td>\n      <td>青壮年 自卑者 工作压力大 抑郁的人大部分都会</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>精神病科</td>\n      <td>正电子发射计算机断层扫描 颅脑MRI SPECT显像 脑代谢显像 脑蛋白质代谢显像</td>\n      <td>幻觉 思维破裂 思维紊乱 精神运动性兴奋 色情行为</td>\n      <td>心脏病 心力衰竭</td>\n      <td>药物治疗</td>\n      <td>盐酸三氟拉嗪 盐酸氟奋乃静片 卡马西平片</td>\n      <td>30天</td>\n      <td>10%</td>\n      <td>市三甲医院约（10000-50000元）</td>\n    </tr>\n    <tr>\n      <th>9</th>\n      <td>早孕反应</td>\n      <td>妊娠剧吐 妊娠反应  惡阻</td>\n      <td>全身</td>\n      <td>妊娠早期孕妇</td>\n      <td>无传染性</td>\n      <td>非医保疾病</td>\n      <td>产科</td>\n      <td>尿酮体试验 尿酮体 产科B超 尿HCG 早孕试纸</td>\n      <td>恶心与呕吐 尿频 食欲异常 尿妊娠试验阳性 早孕反应重</td>\n      <td>食管穿孔</td>\n      <td>药物治疗</td>\n      <td>叶酸片 嗣育保胎丸 胎宝胶囊</td>\n      <td>7-14天</td>\n      <td>95%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>10</th>\n      <td>食道癌</td>\n      <td>食管癌 膈症 噎膈</td>\n      <td>食管</td>\n      <td>中老年人群</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>肿瘤科 消化内科</td>\n      <td>胃部检查 上消化道功能测定和显像 色素内镜检查 血清肿瘤特异性生长因子 多药耐药基因</td>\n      <td>梗噎 进食困难 吞咽困难 吞咽障碍 消瘦</td>\n      <td>黄疸 吸入性肺炎 肥大性骨关节病 食管穿孔</td>\n      <td>手术治疗 放化疗</td>\n      <td>云芝糖肽胶囊 复方天仙胶囊 去甲斑蝥素片</td>\n      <td>1-3个月</td>\n      <td>3%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>11</th>\n      <td>麦粒肿</td>\n      <td>针眼 眼睑炎 睑腺炎</td>\n      <td>眼</td>\n      <td>青年人</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>眼科 中医科</td>\n      <td>无</td>\n      <td>眼屎多 眼睑脓肿 睑结膜充血露出黄色脓块 眼睛发红 眼痛</td>\n      <td>无</td>\n      <td>药物治疗 手术治疗</td>\n      <td>复方磺胺甲噁唑... 头孢克洛干混悬... 熊胆黄芩滴眼液</td>\n      <td>3-7天</td>\n      <td>98%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>12</th>\n      <td>鼻咽癌</td>\n      <td>石上疽</td>\n      <td>鼻</td>\n      <td>中年人群</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>肿瘤科 耳鼻喉科</td>\n      <td>颅底片 全身显像 鼻咽部MRI 正电子发射计算机断层扫描 血清EB病毒抗体</td>\n      <td>耳内闭塞感 鼻内似有擤不出的鼻涕 张口呼吸 咽部异物感 鼻咽腔狭窄</td>\n      <td>无</td>\n      <td>放射治疗 手术治疗</td>\n      <td>平消胶囊 鼻咽灵片 转移因子口服溶...</td>\n      <td>1-3个月</td>\n      <td>10%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>13</th>\n      <td>急性胰腺炎</td>\n      <td>胰腺炎 胰瘅</td>\n      <td>胰腺</td>\n      <td>所有人群 发生于妊娠的任何时期 以妊娠晚期及产褥期较多。</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>消化内科 肝胆外科</td>\n      <td>血清淀粉酶同工酶 血清脂肪酶 血清抗胰腺腺泡抗体 血清胰癌胚抗原 血清胰腺特异性抗原</td>\n      <td>胰源性腹痛 突发性右上腹绞痛 恶心与呕吐 急腹症 上腹部压痛</td>\n      <td>无</td>\n      <td>药物治疗 手术治疗</td>\n      <td>清胰利胆颗粒 醋酸奥曲肽注射... 醋酸奥曲肽注射...</td>\n      <td>无</td>\n      <td>80%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>14</th>\n      <td>胆囊炎</td>\n      <td>无</td>\n      <td>胆</td>\n      <td>肥胖且多次妊娠的妇女</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>肝胆外科 消化内科</td>\n      <td>胆道镜 胆囊胆道B超 肝脏及胆囊叩诊 肝 胆 脾CT 血清异枸橼酸脱氢酶</td>\n      <td>右上腹压痛 恶心 发烧 腹肌紧张 右上腹痛</td>\n      <td>老年人胆囊炎 妊娠合并急性胆囊炎 急性胆囊炎 小儿急性胆囊炎 慢性胆囊炎</td>\n      <td>药物治疗 手术治疗</td>\n      <td>盐酸左氧氟沙星... 盐酸米诺环素胶... 盐酸左氧氟沙星...</td>\n      <td>14--30天</td>\n      <td>90%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>15</th>\n      <td>地中海贫血</td>\n      <td>地贫 海洋性贫血 珠蛋白生成障碍性贫血</td>\n      <td>血液血管</td>\n      <td>所有人群 婴幼儿</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>血液科 儿科</td>\n      <td>Hb-F碱变性试验 骨髓象分析 异常红细胞形态 红细胞检查 红细胞渗透脆性试验</td>\n      <td>气血不足 脾肿大 头晕 皮肤呈浅黄或深金黄色 重度贫血</td>\n      <td>肝硬化 贫血 肝炎 积聚 溶血</td>\n      <td>药物治疗</td>\n      <td>鱼鳞病片 参一胶囊 康逆胶囊</td>\n      <td>1---3个月</td>\n      <td>30--60%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>16</th>\n      <td>子宫内膜癌</td>\n      <td>子宫体癌 子宫癌</td>\n      <td>子宫</td>\n      <td>围绝经期和绝经后女性</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>肿瘤科 妇科</td>\n      <td>生殖系统肿瘤检查项目 子宫颈涂片测试 子宫内膜活检 子宫输卵管造影 p53基因</td>\n      <td>阴道出血 阴道分泌物增多 下腹疼痛 下腹胀痛 下腹部包块</td>\n      <td>子宫肌瘤 多囊卵巢综合征 功血</td>\n      <td>药物治疗 手术治疗</td>\n      <td>金鸡颗粒 金鸡片 金鸡胶囊</td>\n      <td>1-3个月</td>\n      <td>40%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>17</th>\n      <td>动脉硬化</td>\n      <td>动脉粥样硬化</td>\n      <td>血液血管</td>\n      <td>青少年时期发生 中老年时期加重 发病</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>心血管内科 心胸外科</td>\n      <td>大生化检查 血流变学检查 动脉听诊 动脉血气分析 PaO2</td>\n      <td>头痛 心音异常 胸痛 头晕 动脉呈多处伸长扭曲状</td>\n      <td>高血压 心绞痛 猝死 神经衰弱</td>\n      <td>药物治疗</td>\n      <td>活血通脉片 复方氨基丁酸维... 长春胺缓释胶囊</td>\n      <td>3个月</td>\n      <td>70%</td>\n      <td>市三甲医院约（3000 —— 5000元）</td>\n    </tr>\n    <tr>\n      <th>18</th>\n      <td>扁平疣</td>\n      <td>瘊子</td>\n      <td>皮肤</td>\n      <td>儿童青少年 亦常见于成人。</td>\n      <td>有传染性</td>\n      <td>医保疾病</td>\n      <td>皮肤科 中医科</td>\n      <td>无</td>\n      <td>皮肤瘙痒 丘疹</td>\n      <td>无</td>\n      <td>药物治疗 手术治疗</td>\n      <td>转移因子胶囊 十三味菥蓂丸 五妙水仙膏</td>\n      <td>28--42天</td>\n      <td>98%</td>\n      <td>市三甲医院约（300 —— 500元）;</td>\n    </tr>\n    <tr>\n      <th>19</th>\n      <td>神经衰弱</td>\n      <td>神经衰弱症 神劳</td>\n      <td>全身</td>\n      <td>16到40岁 脑力劳动者多见</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>神经内科 心理咨询</td>\n      <td>心电图 脑电图 肌电图 脑多普勒超声</td>\n      <td>易激惹 易疲乏 保持睡眠障碍性失眠 头痛 神经官能症</td>\n      <td>月经不调 便秘 植物神经紊乱 阳痿 拉肚子</td>\n      <td>药物治疗 情绪疗法</td>\n      <td>天麻素胶囊 泻肝安神丸 益脑胶囊</td>\n      <td>120天</td>\n      <td>20%(一般在正规综合三甲医院的典型病例治愈</td>\n      <td>市三甲医院约（1000 —— 3000元）</td>\n    </tr>\n    <tr>\n      <th>20</th>\n      <td>尿道炎</td>\n      <td>尿道炎症</td>\n      <td>尿道</td>\n      <td>所有人群 多见于女性</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>肾内科 泌尿外科</td>\n      <td>阴道毛滴虫检查 眼标本的细菌学检查 尿道口检查 尿道分泌物检查 尿常规</td>\n      <td>尿道烧灼感 尿道痒感 白色黏液状尿 尿道刺痒 尿道口有白膜形成</td>\n      <td>盆腔炎 前列腺炎 附睾炎 膀胱炎 尿道狭窄</td>\n      <td>药物治疗</td>\n      <td>复方石韦颗粒 磷霉素氨丁三醇... 解毒通淋丸</td>\n      <td>15-30天</td>\n      <td>95%</td>\n      <td>市三甲医院约200--500元</td>\n    </tr>\n    <tr>\n      <th>21</th>\n      <td>性欲亢进</td>\n      <td>性欲过盛 性欲过旺</td>\n      <td>全身</td>\n      <td>中年 青年较多发</td>\n      <td>无传染性</td>\n      <td>非医保疾病</td>\n      <td>生殖健康 心理咨询</td>\n      <td>颅脑CT 性激素六项</td>\n      <td>迷走神经兴奋 阴茎异常勃起 性上瘾</td>\n      <td>前列腺炎</td>\n      <td>心理治疗 药物治疗</td>\n      <td>抑亢丸 甲亢灵胶囊 甲亢灵颗粒</td>\n      <td>1-2个月</td>\n      <td>70-80%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>22</th>\n      <td>哮喘</td>\n      <td>支气管哮喘</td>\n      <td>肺</td>\n      <td>所有人群</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>呼吸内科 中医科</td>\n      <td>动脉血气分析 肺功能 PaO2 皮肤划痕试验 皮内试验</td>\n      <td>鼻煽 喉鸣声 干咳 呼吸困难 喘息</td>\n      <td>肺气肿 气胸 猝死 肺水肿 消化道出血</td>\n      <td>药物治疗</td>\n      <td>盐酸氨溴索片 胆茶碱片 曲尼司特胶囊</td>\n      <td>15天(国内最认可的有效治疗手段的该病治疗</td>\n      <td>80%(当今的治疗手段可使接近80%的哮喘患者</td>\n      <td>市三甲医院约（5000-10000元）</td>\n    </tr>\n    <tr>\n      <th>23</th>\n      <td>尿毒症</td>\n      <td>无</td>\n      <td>肾</td>\n      <td>中老年人群</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>肾内科</td>\n      <td>氨基酸 阴离子隙 尿常规 血液生化六项 放射性核素肾图</td>\n      <td>少尿 肾衰竭 食欲下降 双肾弥漫性病变 双下肢可凹陷性水肿</td>\n      <td>肺水肿 贫血 高血压 糖尿病 高钾血症</td>\n      <td>保守疗法 血液透析 腹膜透析 肾移植</td>\n      <td>复方α-酮酸片 吗替麦考酚酯胶... 他克莫司胶囊</td>\n      <td>6个月</td>\n      <td>10%(治疗后80%可以好转)</td>\n      <td>市三甲医院约（50000-100000元）</td>\n    </tr>\n    <tr>\n      <th>24</th>\n      <td>流产</td>\n      <td>小产</td>\n      <td>子宫</td>\n      <td>孕龄女性 怀孕准妈妈</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>产科</td>\n      <td>阴道细胞学检查 盆腔和阴道B超 阴道镜 阴道分泌物涂片 缩宫素激惹试验</td>\n      <td>先兆流产 妊娠时伴有腹痛的阴道流血 自发性流产 难免流产或不可避免流产 习惯性流产</td>\n      <td>失血性休克 休克 腹膜炎 败血症 盆腔结缔组织炎</td>\n      <td>手术治疗</td>\n      <td>孕康颗粒 注射用绒促性素 维生素E软胶囊</td>\n      <td>7-30天</td>\n      <td>80%</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>25</th>\n      <td>低血压</td>\n      <td>血压过低</td>\n      <td>血液血管</td>\n      <td>所有人群 经常从事较大运动量的人群如体育运动员 重体力劳动者 而体型瘦长的年轻妇</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>心血管内科</td>\n      <td>动态血压监测(ABPM) 血压测量 心电图 动态心电图 心脏血管超声检查</td>\n      <td>头晕 无力 疲乏 心前区隐痛 蹲下起来后眼前发黑</td>\n      <td>眩晕 心绞痛 尿道癌 人流后妇科病 女性尿道癌</td>\n      <td>西医药物治疗 中医治疗治疗</td>\n      <td>注射用左卡尼汀 注射用左卡尼汀 注射用左卡尼汀</td>\n      <td>5-20天</td>\n      <td>90%</td>\n      <td>市三甲医院约（1000 —— 2000元</td>\n    </tr>\n    <tr>\n      <th>26</th>\n      <td>不孕症</td>\n      <td>不孕不育 不孕 女性不孕</td>\n      <td>女性生殖</td>\n      <td>成年人群 孕龄女性</td>\n      <td>无传染性</td>\n      <td>医保疾病</td>\n      <td>生殖健康 妇科</td>\n      <td>促黄体生成素 自身免疫抗体检测 不孕不育的免疫学检查 不孕不育检查 宫颈粘液相合试验</td>\n      <td>月经失调 阴道不规则出血 阴道分泌物增多 月经量多 月经稀少</td>\n      <td>子宫肌瘤 阴道横隔 急性子宫内膜炎 乳腺增生 早泄</td>\n      <td>对症治疗 中医中药治疗 试管培养</td>\n      <td>地屈孕酮片 天紫红女金胶囊 散结镇痛胶囊</td>\n      <td>2-3月</td>\n      <td>一般经过特殊治疗后 95%能够治愈</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>27</th>\n      <td>肾虚</td>\n      <td>无</td>\n      <td>肾</td>\n      <td>中老年人群尤其是40岁以上的人群 性生活多的男性</td>\n      <td>无传染性</td>\n      <td>非医保疾病</td>\n      <td>肾内科 中医科</td>\n      <td>肾功能 尿常规</td>\n      <td>尿频 性欲减退 腰酸背痛 腰酸 月经失调</td>\n      <td>肾虚眩晕 肾虚腰痛 肾虚耳鸣 肾精亏虚</td>\n      <td>药物治疗</td>\n      <td>肾宝片 四子填精胶囊 蓉蛾益肾口服液</td>\n      <td>10-30天</td>\n      <td>80%</td>\n      <td>市三甲医院约（1000 —— 3000元）</td>\n    </tr>\n    <tr>\n      <th>28</th>\n      <td>婴幼儿腹泻</td>\n      <td>初生儿腹泻</td>\n      <td>胃 胃</td>\n      <td>婴幼儿</td>\n      <td>无传染性</td>\n      <td>非医保疾病</td>\n      <td>儿科 消化内科</td>\n      <td>便常规 胰腺外分泌功能试验 纤维结肠镜 呼气试验 粪便淀粉颗粒</td>\n      <td>粪便量多 发烧 失水 黄绿稀溏 电解质紊乱</td>\n      <td>急性心力衰竭 心肌炎 肾衰 贫血 鹅口疮</td>\n      <td>营养不良 多种维生素缺乏 鹅口疮</td>\n      <td>肠炎宁片 止痢宁片 复方小檗碱鞣酸...</td>\n      <td>无</td>\n      <td>100%</td>\n      <td>无</td>\n    </tr>\n  </tbody>\n</table>\n</div>"
     },
     "execution_count": 35,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "data = pd.read_csv('data/disease.csv')\n",
    "data = data.fillna('无')\n",
    "data"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-23T11:11:04.399820Z",
     "end_time": "2025-09-23T11:11:04.435453Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": 36,
   "outputs": [
    {
     "data": {
      "text/plain": "[('阳痿',\n  '勃起功能障碍 勃起机能障碍 勃起无力 阳萎 勃起不足',\n  '阴茎',\n  '成年男性',\n  '无传染性',\n  '非医保疾病',\n  '男科 生殖健康',\n  '外生殖器检查 前列腺B超 阴茎超声检查 泌乳素分泌抑制试验 泌乳素兴奋试验  ',\n  '心理性性功能障碍 男子性功能障碍 雄激素过少 精冷不育 脉涩或结  ',\n  '无',\n  '药物治疗 心理治疗  ',\n  '枸橼酸西地那非... 枸橼酸西地那非... 他达拉非片  ',\n  '1-2个月',\n  '85%(一般经过有效治疗后可以缓解症状)',\n  '无'),\n ('乙肝',\n  '乙型肝炎',\n  '肝',\n  '所有人群 主要见于青少年 绝大多数为10~30岁',\n  '有传染性',\n  '非医保疾病',\n  '传染科 肝病',\n  '乙肝病毒学指标 凝血酶原时间 乙肝两对半 血清白蛋白与球蛋白比值 血清HBsAg免疫复合物 血清前S1蛋白 血清前S2蛋白 血清抗前S2蛋白 血清免疫球蛋白M 血清乙肝表面抗体  ',\n  '转氨酶增高 肝肿大 乙肝表面抗原（HBsAg）阳性 乙肝e抗原（HBeAg）阳性 肝功能异常  ',\n  '肝性脑病 肝硬化 腹膜炎 消化道出血 肺炎  ',\n  '药物治疗 饮食疗法  ',\n  '恩替卡韦分散片 碧云砂乙肝颗粒 注射用盐酸精氨...  ',\n  '3-6月',\n  '0.00%',\n  '市三甲医院约（3000 —— 8000元）;'),\n ('癫痫',\n  '羊癫疯 羊角风',\n  '颅脑',\n  '所有人群',\n  '无传染性',\n  '医保疾病',\n  '神经内科',\n  '贝美格诱发试验 头颅平片 MRI 脑电图 脑血流灌注断层显像  ',\n  '四肢抽搐 反复高热 惊厥 昏睡 一过性昏厥  ',\n  '肾衰 急性早幼粒细胞白血病 抑郁症  ',\n  '药物治疗  ',\n  '普瑞巴林胶囊 奥卡西平片 左乙拉西坦片  ',\n  '>120天(需要终身治疗)',\n  '暂无相关资料',\n  '市三甲医院约（3000 —— 8000元）'),\n ('月经不调',\n  '月经失调',\n  '卵巢 子宫',\n  '女性 压力过大型 怕冷型 虚弱型 贫血型',\n  '无传染性',\n  '非医保疾病',\n  '妇科',\n  '盆腔和阴道B超 宫颈癌筛查 妇科B超 宫腔镜 宫颈活检  ',\n  '月经量多 月经稀少 月经失调 子宫出血 小腹冷痛 头疼',\n  '痛经 经前期综合征 多囊卵巢综合征 黄褐斑 粉刺  ',\n  '药物治疗  ',\n  '定坤丹 加味益母草膏 艾附暖宫丸  ',\n  '1-2个月',\n  '69%',\n  '市三甲医院约（2000 —— 5000元）'),\n ('颈椎病',\n  '颈椎退行性变 颈椎骨质增生',\n  '脊柱',\n  '中 老年人  40岁以上',\n  '无传染性',\n  '医保疾病',\n  '骨科 神经内科',\n  '颈部活动度 椎间孔挤压试验 颈项强直 臂丛牵拉试验  ',\n  '上肢麻痹 肩背痛 颈椎痛 头颈部活动受限 颈部僵硬 头疼',\n  '食管压迫型颈椎病 椎动脉型颈椎病 脊髓型颈椎病 神经根型颈椎病 颈型颈椎病  ',\n  '药物治疗 理疗 手术治疗 中医针灸治疗  ',\n  '消痛贴膏 颈腰康胶囊 颈复康颗粒  ',\n  '3-6个月',\n  '50%',\n  '无'),\n ('腰肌劳损',\n  '无',\n  '腰部',\n  '长期保持坐姿者 中老年人',\n  '无传染性',\n  '医保疾病',\n  '外伤科 骨科',\n  '腰背部检查 脊柱压痛与叩击痛 拾物试验 腰背痛体格检查  ',\n  '腰酸 弯腰时腰痛 劳累时腰部酸痛或胀痛 腰酸背痛 产育过多后腰痛  ',\n  '筋膜炎 椎管狭窄症  ',\n  '药物治疗 物理治疗 手术治疗  ',\n  '腰痛宁胶囊 腰息痛胶囊 消痛贴膏  ',\n  '4周',\n  '80%',\n  '市三甲医院约（1000 —— 3000元）'),\n ('尿路感染',\n  '尿感 泌尿道感染',\n  '阴茎 尿道',\n  '育龄女性及绝经后妇女 糖尿病及高龄 免疫缺陷',\n  '无传染性',\n  '医保疾病',\n  '泌尿外科',\n  '肾脏B超 放射性核素肾图 逆行肾盂造影 泌尿系统CT 尿路平片  ',\n  '复杂性尿路感染 肾脓肿 反复不愈的尿道感染 尿液混浊 真性菌尿  ',\n  '肾盂肾炎 肾炎 肾周围炎 尿路梗阻 血尿  ',\n  '药物治疗  ',\n  '盐酸左氧氟沙星... 盐酸头孢他美酯... 注射用盐酸左氧...  ',\n  '2周',\n  '90%',\n  '市三甲医院约（500-1000元）'),\n ('股骨头坏死',\n  '骨蚀 股骨头无菌性坏死 股骨头缺血性坏死',\n  '大腿 下肢骨',\n  '中老年人',\n  '无传染性',\n  '医保疾病',\n  '骨科 中西医结合科',\n  '四肢的骨和关节平片 骨与关节MRI 4字试验 骨关节及软组织CT  ',\n  '髋关节痛 间歇性跛行 大腿刺痛 大腿肌肉萎缩  ',\n  '骨关节炎 瘫痪  ',\n  '西医治疗 中医治疗 手术治疗  ',\n  '通络生骨胶囊 硫酸氨基葡萄糖... 活血健骨片  ',\n  '30-100天',\n  '20%',\n  '据不同医院 收费标准不一致 市三甲医院约（5000 —— 8000元）'),\n ('精神分裂症',\n  '无',\n  '心理',\n  '青壮年 自卑者 工作压力大 抑郁的人大部分都会',\n  '无传染性',\n  '医保疾病',\n  '精神病科',\n  '正电子发射计算机断层扫描 颅脑MRI SPECT显像 脑代谢显像 脑蛋白质代谢显像  ',\n  '幻觉 思维破裂 思维紊乱 精神运动性兴奋 色情行为  ',\n  '心脏病 心力衰竭  ',\n  '药物治疗  ',\n  '盐酸三氟拉嗪 盐酸氟奋乃静片 卡马西平片  ',\n  '30天',\n  '10%',\n  '市三甲医院约（10000-50000元）'),\n ('早孕反应',\n  '妊娠剧吐 妊娠反应  惡阻',\n  '全身',\n  '妊娠早期孕妇',\n  '无传染性',\n  '非医保疾病',\n  '产科',\n  '尿酮体试验 尿酮体 产科B超 尿HCG 早孕试纸  ',\n  '恶心与呕吐 尿频 食欲异常 尿妊娠试验阳性 早孕反应重  ',\n  '食管穿孔  ',\n  '药物治疗  ',\n  '叶酸片 嗣育保胎丸 胎宝胶囊  ',\n  '7-14天',\n  '95%',\n  '无'),\n ('食道癌',\n  '食管癌 膈症 噎膈',\n  '食管',\n  '中老年人群',\n  '无传染性',\n  '医保疾病',\n  '肿瘤科 消化内科',\n  '胃部检查 上消化道功能测定和显像 色素内镜检查 血清肿瘤特异性生长因子 多药耐药基因  ',\n  '梗噎 进食困难 吞咽困难 吞咽障碍 消瘦  ',\n  '黄疸 吸入性肺炎 肥大性骨关节病 食管穿孔  ',\n  '手术治疗 放化疗  ',\n  '云芝糖肽胶囊 复方天仙胶囊 去甲斑蝥素片  ',\n  '1-3个月',\n  '3%',\n  '无'),\n ('麦粒肿',\n  '针眼 眼睑炎 睑腺炎',\n  '眼',\n  '青年人',\n  '无传染性',\n  '医保疾病',\n  '眼科 中医科',\n  '无',\n  '眼屎多 眼睑脓肿 睑结膜充血露出黄色脓块 眼睛发红 眼痛  ',\n  '无',\n  '药物治疗 手术治疗  ',\n  '复方磺胺甲噁唑... 头孢克洛干混悬... 熊胆黄芩滴眼液  ',\n  '3-7天',\n  '98%',\n  '无'),\n ('鼻咽癌',\n  '石上疽',\n  '鼻',\n  '中年人群',\n  '无传染性',\n  '医保疾病',\n  '肿瘤科 耳鼻喉科',\n  '颅底片 全身显像 鼻咽部MRI 正电子发射计算机断层扫描 血清EB病毒抗体  ',\n  '耳内闭塞感 鼻内似有擤不出的鼻涕 张口呼吸 咽部异物感 鼻咽腔狭窄  ',\n  '无',\n  '放射治疗 手术治疗  ',\n  '平消胶囊 鼻咽灵片 转移因子口服溶...  ',\n  '1-3个月',\n  '10%',\n  '无'),\n ('急性胰腺炎',\n  '胰腺炎 胰瘅',\n  '胰腺',\n  '所有人群 发生于妊娠的任何时期 以妊娠晚期及产褥期较多。',\n  '无传染性',\n  '医保疾病',\n  '消化内科 肝胆外科',\n  '血清淀粉酶同工酶 血清脂肪酶 血清抗胰腺腺泡抗体 血清胰癌胚抗原 血清胰腺特异性抗原  ',\n  '胰源性腹痛 突发性右上腹绞痛 恶心与呕吐 急腹症 上腹部压痛  ',\n  '无',\n  '药物治疗 手术治疗  ',\n  '清胰利胆颗粒 醋酸奥曲肽注射... 醋酸奥曲肽注射...  ',\n  '无',\n  '80%',\n  '无'),\n ('胆囊炎',\n  '无',\n  '胆',\n  '肥胖且多次妊娠的妇女',\n  '无传染性',\n  '医保疾病',\n  '肝胆外科 消化内科',\n  '胆道镜 胆囊胆道B超 肝脏及胆囊叩诊 肝 胆 脾CT 血清异枸橼酸脱氢酶  ',\n  '右上腹压痛 恶心 发烧 腹肌紧张 右上腹痛  ',\n  '老年人胆囊炎 妊娠合并急性胆囊炎 急性胆囊炎 小儿急性胆囊炎 慢性胆囊炎  ',\n  '药物治疗 手术治疗  ',\n  '盐酸左氧氟沙星... 盐酸米诺环素胶... 盐酸左氧氟沙星...  ',\n  '14--30天',\n  '90%',\n  '无'),\n ('地中海贫血',\n  '地贫 海洋性贫血 珠蛋白生成障碍性贫血',\n  '血液血管',\n  '所有人群 婴幼儿',\n  '无传染性',\n  '医保疾病',\n  '血液科 儿科',\n  'Hb-F碱变性试验 骨髓象分析 异常红细胞形态 红细胞检查 红细胞渗透脆性试验  ',\n  '气血不足 脾肿大 头晕 皮肤呈浅黄或深金黄色 重度贫血  ',\n  '肝硬化 贫血 肝炎 积聚 溶血  ',\n  '药物治疗  ',\n  '鱼鳞病片 参一胶囊 康逆胶囊  ',\n  '1---3个月',\n  '30--60%',\n  '无'),\n ('子宫内膜癌',\n  '子宫体癌 子宫癌',\n  '子宫',\n  '围绝经期和绝经后女性',\n  '无传染性',\n  '医保疾病',\n  '肿瘤科 妇科',\n  '生殖系统肿瘤检查项目 子宫颈涂片测试 子宫内膜活检 子宫输卵管造影 p53基因  ',\n  '阴道出血 阴道分泌物增多 下腹疼痛 下腹胀痛 下腹部包块  ',\n  '子宫肌瘤 多囊卵巢综合征 功血  ',\n  '药物治疗 手术治疗  ',\n  '金鸡颗粒 金鸡片 金鸡胶囊  ',\n  '1-3个月',\n  '40%',\n  '无'),\n ('动脉硬化',\n  '动脉粥样硬化',\n  '血液血管',\n  '青少年时期发生 中老年时期加重 发病',\n  '无传染性',\n  '医保疾病',\n  '心血管内科 心胸外科',\n  '大生化检查 血流变学检查 动脉听诊 动脉血气分析 PaO2  ',\n  '头痛 心音异常 胸痛 头晕 动脉呈多处伸长扭曲状  ',\n  '高血压 心绞痛 猝死 神经衰弱  ',\n  '药物治疗  ',\n  '活血通脉片 复方氨基丁酸维... 长春胺缓释胶囊  ',\n  '3个月',\n  '70%',\n  '市三甲医院约（3000 —— 5000元）'),\n ('扁平疣',\n  '瘊子',\n  '皮肤',\n  '儿童青少年 亦常见于成人。',\n  '有传染性',\n  '医保疾病',\n  '皮肤科 中医科',\n  '无',\n  '皮肤瘙痒 丘疹  ',\n  '无',\n  '药物治疗 手术治疗  ',\n  '转移因子胶囊 十三味菥蓂丸 五妙水仙膏  ',\n  '28--42天',\n  '98%',\n  '市三甲医院约（300 —— 500元）;'),\n ('神经衰弱',\n  '神经衰弱症 神劳',\n  '全身',\n  '16到40岁 脑力劳动者多见',\n  '无传染性',\n  '医保疾病',\n  '神经内科 心理咨询',\n  '心电图 脑电图 肌电图 脑多普勒超声  ',\n  '易激惹 易疲乏 保持睡眠障碍性失眠 头痛 神经官能症  ',\n  '月经不调 便秘 植物神经紊乱 阳痿 拉肚子  ',\n  '药物治疗 情绪疗法  ',\n  '天麻素胶囊 泻肝安神丸 益脑胶囊  ',\n  '120天',\n  '20%(一般在正规综合三甲医院的典型病例治愈',\n  '市三甲医院约（1000 —— 3000元）'),\n ('尿道炎',\n  '尿道炎症',\n  '尿道',\n  '所有人群 多见于女性',\n  '无传染性',\n  '医保疾病',\n  '肾内科 泌尿外科',\n  '阴道毛滴虫检查 眼标本的细菌学检查 尿道口检查 尿道分泌物检查 尿常规  ',\n  '尿道烧灼感 尿道痒感 白色黏液状尿 尿道刺痒 尿道口有白膜形成  ',\n  '盆腔炎 前列腺炎 附睾炎 膀胱炎 尿道狭窄  ',\n  '药物治疗  ',\n  '复方石韦颗粒 磷霉素氨丁三醇... 解毒通淋丸  ',\n  '15-30天',\n  '95%',\n  '市三甲医院约200--500元'),\n ('性欲亢进',\n  '性欲过盛 性欲过旺',\n  '全身',\n  '中年 青年较多发',\n  '无传染性',\n  '非医保疾病',\n  '生殖健康 心理咨询',\n  '颅脑CT 性激素六项  ',\n  '迷走神经兴奋 阴茎异常勃起 性上瘾  ',\n  '前列腺炎  ',\n  '心理治疗 药物治疗  ',\n  '抑亢丸 甲亢灵胶囊 甲亢灵颗粒  ',\n  '1-2个月',\n  '70-80%',\n  '无'),\n ('哮喘',\n  '支气管哮喘',\n  '肺',\n  '所有人群',\n  '无传染性',\n  '医保疾病',\n  '呼吸内科 中医科',\n  '动脉血气分析 肺功能 PaO2 皮肤划痕试验 皮内试验  ',\n  '鼻煽 喉鸣声 干咳 呼吸困难 喘息  ',\n  '肺气肿 气胸 猝死 肺水肿 消化道出血  ',\n  '药物治疗  ',\n  '盐酸氨溴索片 胆茶碱片 曲尼司特胶囊  ',\n  '15天(国内最认可的有效治疗手段的该病治疗',\n  '80%(当今的治疗手段可使接近80%的哮喘患者',\n  '市三甲医院约（5000-10000元）'),\n ('尿毒症',\n  '无',\n  '肾',\n  '中老年人群',\n  '无传染性',\n  '医保疾病',\n  '肾内科',\n  '氨基酸 阴离子隙 尿常规 血液生化六项 放射性核素肾图  ',\n  '少尿 肾衰竭 食欲下降 双肾弥漫性病变 双下肢可凹陷性水肿  ',\n  '肺水肿 贫血 高血压 糖尿病 高钾血症  ',\n  '保守疗法 血液透析 腹膜透析 肾移植  ',\n  '复方α-酮酸片 吗替麦考酚酯胶... 他克莫司胶囊  ',\n  '6个月',\n  '10%(治疗后80%可以好转)',\n  '市三甲医院约（50000-100000元）'),\n ('流产',\n  '小产',\n  '子宫',\n  '孕龄女性 怀孕准妈妈',\n  '无传染性',\n  '医保疾病',\n  '产科',\n  '阴道细胞学检查 盆腔和阴道B超 阴道镜 阴道分泌物涂片 缩宫素激惹试验  ',\n  '先兆流产 妊娠时伴有腹痛的阴道流血 自发性流产 难免流产或不可避免流产 习惯性流产  ',\n  '失血性休克 休克 腹膜炎 败血症 盆腔结缔组织炎  ',\n  '手术治疗  ',\n  '孕康颗粒 注射用绒促性素 维生素E软胶囊  ',\n  '7-30天',\n  '80%',\n  '无'),\n ('低血压',\n  '血压过低',\n  '血液血管',\n  '所有人群 经常从事较大运动量的人群如体育运动员 重体力劳动者 而体型瘦长的年轻妇',\n  '无传染性',\n  '医保疾病',\n  '心血管内科',\n  '动态血压监测(ABPM) 血压测量 心电图 动态心电图 心脏血管超声检查  ',\n  '头晕 无力 疲乏 心前区隐痛 蹲下起来后眼前发黑  ',\n  '眩晕 心绞痛 尿道癌 人流后妇科病 女性尿道癌  ',\n  '西医药物治疗 中医治疗治疗  ',\n  '注射用左卡尼汀 注射用左卡尼汀 注射用左卡尼汀  ',\n  '5-20天',\n  '90%',\n  '市三甲医院约（1000 —— 2000元'),\n ('不孕症',\n  '不孕不育 不孕 女性不孕',\n  '女性生殖',\n  '成年人群 孕龄女性',\n  '无传染性',\n  '医保疾病',\n  '生殖健康 妇科',\n  '促黄体生成素 自身免疫抗体检测 不孕不育的免疫学检查 不孕不育检查 宫颈粘液相合试验  ',\n  '月经失调 阴道不规则出血 阴道分泌物增多 月经量多 月经稀少  ',\n  '子宫肌瘤 阴道横隔 急性子宫内膜炎 乳腺增生 早泄  ',\n  '对症治疗 中医中药治疗 试管培养  ',\n  '地屈孕酮片 天紫红女金胶囊 散结镇痛胶囊  ',\n  '2-3月',\n  '一般经过特殊治疗后 95%能够治愈',\n  '无'),\n ('肾虚',\n  '无',\n  '肾',\n  '中老年人群尤其是40岁以上的人群 性生活多的男性',\n  '无传染性',\n  '非医保疾病',\n  '肾内科 中医科',\n  '肾功能 尿常规  ',\n  '尿频 性欲减退 腰酸背痛 腰酸 月经失调  ',\n  '肾虚眩晕 肾虚腰痛 肾虚耳鸣 肾精亏虚  ',\n  '药物治疗  ',\n  '肾宝片 四子填精胶囊 蓉蛾益肾口服液  ',\n  '10-30天',\n  '80%',\n  '市三甲医院约（1000 —— 3000元）'),\n ('婴幼儿腹泻',\n  '初生儿腹泻',\n  '胃 胃',\n  '婴幼儿',\n  '无传染性',\n  '非医保疾病',\n  '儿科 消化内科',\n  '便常规 胰腺外分泌功能试验 纤维结肠镜 呼气试验 粪便淀粉颗粒  ',\n  '粪便量多 发烧 失水 黄绿稀溏 电解质紊乱  ',\n  '急性心力衰竭 心肌炎 肾衰 贫血 鹅口疮  ',\n  '营养不良 多种维生素缺乏 鹅口疮  ',\n  '肠炎宁片 止痢宁片 复方小檗碱鞣酸...  ',\n  '无',\n  '100%',\n  '无')]"
     },
     "execution_count": 36,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# 对于disease3.csv的数据处理\n",
    "# name是核心\n",
    "df = list(data.itertuples(index=False, name=None))\n",
    "df"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-23T11:11:15.643714Z",
     "end_time": "2025-09-23T11:11:15.678042Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": 37,
   "outputs": [],
   "source": [
    "# 第一步 将数据导入neo4j中\n",
    "for d in df:\n",
    "    # 读取点数据\n",
    "    name = d[0]\n",
    "    alias = d[1].split()\n",
    "    part = d[2].split()\n",
    "    age = d[3].split()\n",
    "    infection = d[4]\n",
    "    insurance = d[5]\n",
    "    department = d[6].split()\n",
    "    check_list = d[7].split()\n",
    "    symptom = d[8].split()\n",
    "    complication  = d[9].split()\n",
    "    treatment = d[10].split()\n",
    "    drug = d[11].split()\n",
    "    period = d[12]\n",
    "    rate = d[13]\n",
    "    money = d[14]\n",
    "\n",
    "    # 创建点\n",
    "    name_Node = Node('Name',name = name)\n",
    "    alias_Nodes = [Node('alias',name = i)for i in alias]\n",
    "    part_Nodes = [Node('part',name = i)for i in part]\n",
    "    age_Nodes = [Node('age',name = i)for i in age]\n",
    "    infection_Node = Node('infection',name = infection)\n",
    "    insurance_Node = Node('insurance',name = insurance)\n",
    "    department_Nodes = [Node('department',name = i)for i in department]\n",
    "    check_list_Nodes = [Node('check_list',name = i)for i in check_list]\n",
    "    symptom_Nodes = [Node('symptom',name = i)for i in symptom]\n",
    "    complication_Nodes = [Node('complication',name = i)for i in complication]\n",
    "    treatment_Nodes = [Node('treatment',name = i) for i in treatment]\n",
    "    drug_Nodes = [Node('drug',name = i)for i in drug]\n",
    "    period_Node = Node('period',name = period)\n",
    "    rate_Node = Node('rate',name = rate)\n",
    "    money_Node = Node('money',name = money)\n",
    "\n",
    "    # 将节点加入到图数据库中\n",
    "    graph.merge(name_Node,'Name','name')\n",
    "    for node in alias_Nodes:\n",
    "        graph.merge(node,'alias','name')\n",
    "    for node in part_Nodes:\n",
    "        graph.merge(node,'part','name')\n",
    "    for node in age_Nodes:\n",
    "        graph.merge(node,'age','name')\n",
    "    graph.merge(infection_Node,'infection','name')\n",
    "    graph.merge(insurance_Node,'insurance','name')\n",
    "    for node in department_Nodes:\n",
    "        graph.merge(node,'department','name')\n",
    "    for node in check_list_Nodes:\n",
    "        graph.merge(node,'check_list','name')\n",
    "    for node in symptom_Nodes:\n",
    "        graph.merge(node,'symptom','name')\n",
    "    for node in complication_Nodes:\n",
    "        graph.merge(node,'complication','name')\n",
    "    for node in treatment_Nodes:\n",
    "        graph.merge(node,'treatment','name')\n",
    "    for node in drug_Nodes:\n",
    "        graph.merge(node,'drug','name')\n",
    "    graph.merge(period_Node,'period','name')\n",
    "    graph.merge(rate_Node,'rate','name')\n",
    "    graph.merge(money_Node,'money','name')\n",
    "\n",
    "    # 创建关系（14个）name与其他属性关系，并插入\n",
    "    for node in alias_Nodes:\n",
    "        rs = Relationship(name_Node, '别名', node)\n",
    "        graph.merge(rs)\n",
    "    for node in part_Nodes:\n",
    "        rs = Relationship(name_Node, '发病部位', node)\n",
    "        graph.merge(rs)\n",
    "    for node in age_Nodes:\n",
    "        rs = Relationship(name_Node, '患病人群', node)\n",
    "        graph.merge(rs)\n",
    "    graph.merge(Relationship(name_Node, '传染性', infection_Node))\n",
    "    graph.merge(Relationship(name_Node, '医疗报销', insurance_Node))\n",
    "    for node in department_Nodes:\n",
    "        rs = Relationship(name_Node, '治疗科室', node)\n",
    "        graph.merge(rs)\n",
    "    for node in check_list_Nodes:\n",
    "        rs = Relationship(name_Node, '检查项目', node)\n",
    "        graph.merge(rs)\n",
    "    for node in symptom_Nodes:\n",
    "        rs = Relationship(name_Node, '症状', node)\n",
    "        graph.merge(rs)\n",
    "    for node in complication_Nodes:\n",
    "        rs = Relationship(name_Node, '并发症', node)\n",
    "        graph.merge(rs)\n",
    "    for node in treatment_Nodes:\n",
    "        rs = Relationship(name_Node, '治疗方式', node)\n",
    "        graph.merge(rs)\n",
    "    for node in drug_Nodes:\n",
    "        rs = Relationship(name_Node, '治疗药物', node)\n",
    "        graph.merge(rs)\n",
    "    graph.merge(Relationship(name_Node, '治疗时长', period_Node))\n",
    "    graph.merge(Relationship(name_Node, '痊愈比例', rate_Node))\n",
    "    graph.merge(Relationship(name_Node, '治疗费用', money_Node))"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-23T11:11:16.876247Z",
     "end_time": "2025-09-23T11:11:20.785039Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "outputs": [],
   "source": [
    "# 第二步，写匹配机制，简单：关键字匹配，先实现四种问题的查询\n",
    "'''\n",
    "问题类型：\n",
    "1.病吃药\n",
    "2.药治病\n",
    "3.病什么症状\n",
    "4.症状什么病\n",
    "组合问题：\n",
    "5.症状吃什么药\n",
    "\n",
    "区分的方法：\n",
    "区分1&2和3&4，有无药\n",
    "1，2区分：病在关键词中，还是药在关键词中\n",
    "3，4区分：病在关键词中，还是症状在关键词中\n",
    "\n",
    "将问题分为两个部分，一部分是用户已知，另一部分是用户未知，从已知部分出发，通过cyber查找到未知部分\n",
    "'''"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 137,
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "{'什么药', '该', '吃', '头疼'}\n"
     ]
    }
   ],
   "source": [
    "question = '头疼该吃什么药'\n",
    "# '乙肝吃什么药' '乙肝有什么症状' '转氨酶增高是什么病' '定坤丹能治什么病' '头疼该吃什么药'\n",
    "for word in ['什么药','什么病','哪些药','什么症状','哪些症状','哪些表现']:\n",
    "    jieba.add_word(word)\n",
    "question_key_words = set(jieba.lcut(question,cut_all = False))\n",
    "print(question_key_words)"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-23T17:44:38.890792Z",
     "end_time": "2025-09-23T17:44:38.904589Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": 80,
   "outputs": [],
   "source": [
    "# 创建匹配词典\n",
    "name_known = set(data['name'])\n",
    "alias_known = set(' '.join(list(data['alias'])).split())\n",
    "symptom_known = set((' '.join(list(data['symptom']))).split())\n",
    "drug_known = set((' '.join(list(data['drug']))).split())\n",
    "\n",
    "name_unknown = set(['什么病'])\n",
    "drug_unknown = set(['什么药','哪些药'])\n",
    "symptom_unknown = set(['什么症状','哪些症状','哪些表现'])"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-23T16:47:04.920446Z",
     "end_time": "2025-09-23T16:47:04.940377Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": 138,
   "outputs": [],
   "source": [
    "# 病、症状、药构成三位代码\n",
    "#001 010 100\n",
    "#两个列表做交集是否为空\n",
    "# 例如001 010知道某种病，想查询症状\n",
    "name_in_table = 1 if (question_key_words & name_known) else 0\n",
    "symptom_in_table = 10 if (question_key_words & symptom_known) else 0\n",
    "drug_in_table = 100 if (question_key_words & drug_known) else 0\n",
    "known_code = name_in_table + symptom_in_table + drug_in_table\n",
    "\n",
    "name_in_unk = 1 if (question_key_words & name_unknown) else 0\n",
    "symptom_in_unk = 10 if (question_key_words & symptom_unknown) else 0\n",
    "drug_in_unk = 100 if (question_key_words & drug_unknown) else 0\n",
    "unknown_code = name_in_unk + symptom_in_unk + drug_in_unk"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-23T17:44:51.527001Z",
     "end_time": "2025-09-23T17:44:51.537435Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": 141,
   "outputs": [],
   "source": [
    "# 根据状态代码写查找语句\n",
    "if (known_code,unknown_code) == (1,10):\n",
    "    # 知道病找症状\n",
    "    name = list((question_key_words & name_known))[0]\n",
    "    query = \"\"\"\n",
    "   MATCH (Name:Name{name:$name})-[:`症状`]->(symptom:symptom) RETURN symptom.name;\n",
    "    \"\"\"\n",
    "    results = graph.run(query,name = name)\n",
    "    results = pd.DataFrame(results)\n",
    "    result = list(results.iloc[:,0])\n",
    "elif (known_code,unknown_code) == (1,100):\n",
    "    # 知道病想找到药\n",
    "    name = list((question_key_words & name_known))[0]\n",
    "    query = \"\"\"\n",
    "    MATCH (Name:Name{name:$name})-[:`治疗药物`]->(drug:drug) RETURN drug.name;\n",
    "    \"\"\"\n",
    "    results = graph.run(query,name = name)\n",
    "    results = pd.DataFrame(results)\n",
    "    result = list(results.iloc[:,0])\n",
    "elif (known_code,unknown_code) == (10,1):\n",
    "    # 知道症状找病\n",
    "    symptom = list((question_key_words & symptom_known))[0]\n",
    "    query = \"\"\"\n",
    "    MATCH (Name:Name)-[:`症状`]->(symptom:symptom{name:$name}) RETURN Name.name;\n",
    "    \"\"\"\n",
    "    results = graph.run(query,name = symptom)\n",
    "    results = pd.DataFrame(results)\n",
    "    result = list(results.iloc[:,0])\n",
    "elif (known_code,unknown_code) == (100,1):\n",
    "    # 知道药找病\n",
    "    drug = list((question_key_words & drug_known))[0]\n",
    "    query = \"\"\"\n",
    "    MATCH (Name:Name)-[:`治疗药物`]->(drug:drug{name:$name}) RETURN Name.name;\n",
    "    \"\"\"\n",
    "    results = graph.run(query,name = drug)\n",
    "    results = pd.DataFrame(results)\n",
    "    result = list(results.iloc[:,0])\n",
    "elif (known_code,unknown_code) == (10,100):\n",
    "    # 知道症状找药\n",
    "    symptom = list((question_key_words & symptom_known))[0]\n",
    "    query_1 = \"\"\"\n",
    "    MATCH (Name:Name)-[:`症状`]->(symptom:symptom{name:$name}) RETURN Name.name;\n",
    "    \"\"\"\n",
    "    names = graph.run(query_1,name = symptom)\n",
    "    names = pd.DataFrame(names)\n",
    "    names = list(names.iloc[:,0])\n",
    "    result = pd.DataFrame(columns=['name', 'drug'])\n",
    "    for name in names:\n",
    "        query = \"\"\"\n",
    "    MATCH (Name:Name{name:$name})-[:`治疗药物`]->(drug:drug) RETURN drug.name;\n",
    "    \"\"\"\n",
    "        rs = graph.run(query,name = name)\n",
    "        rs = pd.DataFrame(rs)\n",
    "        rs.insert(0, 'new', name)\n",
    "        rs.columns = ['name', 'drug']\n",
    "        result = pd.concat([result,rs], axis=0, ignore_index=True)"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-23T17:45:35.589984Z",
     "end_time": "2025-09-23T17:45:35.614077Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": 142,
   "outputs": [
    {
     "data": {
      "text/plain": "   name    drug\n0   颈椎病   颈复康颗粒\n1   颈椎病   颈腰康胶囊\n2   颈椎病    消痛贴膏\n3  月经不调   艾附暖宫丸\n4  月经不调  加味益母草膏\n5  月经不调     定坤丹",
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>name</th>\n      <th>drug</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>0</th>\n      <td>颈椎病</td>\n      <td>颈复康颗粒</td>\n    </tr>\n    <tr>\n      <th>1</th>\n      <td>颈椎病</td>\n      <td>颈腰康胶囊</td>\n    </tr>\n    <tr>\n      <th>2</th>\n      <td>颈椎病</td>\n      <td>消痛贴膏</td>\n    </tr>\n    <tr>\n      <th>3</th>\n      <td>月经不调</td>\n      <td>艾附暖宫丸</td>\n    </tr>\n    <tr>\n      <th>4</th>\n      <td>月经不调</td>\n      <td>加味益母草膏</td>\n    </tr>\n    <tr>\n      <th>5</th>\n      <td>月经不调</td>\n      <td>定坤丹</td>\n    </tr>\n  </tbody>\n</table>\n</div>"
     },
     "execution_count": 142,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "result"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-23T17:45:36.098698Z",
     "end_time": "2025-09-23T17:45:36.122885Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "outputs": [],
   "source": [
    "def initial():\n",
    "    for word in ['什么药','什么病','哪些药','什么症状','哪些症状','哪些表现']:\n",
    "        jieba.add_word(word)\n",
    "def get_match_dictionary(data):\n",
    "    # 创建匹配词典\n",
    "    name_known = set(data['name'])\n",
    "    alias_known = set(' '.join(list(data['alias'])).split())\n",
    "    symptom_known = set((' '.join(list(data['symptom']))).split())\n",
    "    drug_known = set((' '.join(list(data['drug']))).split())\n",
    "\n",
    "    name_unknown = set(['什么病'])\n",
    "    drug_unknown = set(['什么药','哪些药'])\n",
    "    symptom_unknown = set(['什么症状','哪些症状','哪些表现'])\n",
    "    return name_known,alias_known,symptom_known,drug_known,name_unknown,drug_unknown,symptom_unknown\n",
    "\n",
    "question = '头疼该吃什么药'# '乙肝吃什么药' '乙肝有什么症状' '转氨酶增高是什么病' '定坤丹能治什么病' '头疼该吃什么药'\n",
    "\n",
    "def get_match_result(graph,question,name_known,symptom_known,drug_known,name_unknown,drug_unknown,symptom_unknown):\n",
    "    question_key_words = set(jieba.lcut(question,cut_all = False))\n",
    "    name_in_table = 1 if (question_key_words & name_known) else 0\n",
    "    symptom_in_table = 10 if (question_key_words & symptom_known) else 0\n",
    "    drug_in_table = 100 if (question_key_words & drug_known) else 0\n",
    "    known_code = name_in_table + symptom_in_table + drug_in_table\n",
    "\n",
    "    name_in_unk = 1 if (question_key_words & name_unknown) else 0\n",
    "    symptom_in_unk = 10 if (question_key_words & symptom_unknown) else 0\n",
    "    drug_in_unk = 100 if (question_key_words & drug_unknown) else 0\n",
    "    unknown_code = name_in_unk + symptom_in_unk + drug_in_unk\n",
    "    statecode = (known_code,unknown_code)\n",
    "    # 根据状态代码写查找语句\n",
    "    if statecode == (1,10):\n",
    "        # 知道病找症状\n",
    "        name = list((question_key_words & name_known))[0]\n",
    "        query = \"\"\"\n",
    "        MATCH (Name:Name{name:$name})-[:`症状`]->(symptom:symptom) RETURN symptom.name;\n",
    "        \"\"\"\n",
    "        results = graph.run(query,name = name)\n",
    "        results = pd.DataFrame(results)\n",
    "        result = list(results.iloc[:,0])\n",
    "    elif statecode == (1,100):\n",
    "        # 知道病想找到药\n",
    "        name = list((question_key_words & name_known))[0]\n",
    "        query = \"\"\"\n",
    "        MATCH (Name:Name{name:$name})-[:`治疗药物`]->(drug:drug) RETURN drug.name;\n",
    "        \"\"\"\n",
    "        results = graph.run(query,name = name)\n",
    "        results = pd.DataFrame(results)\n",
    "        result = list(results.iloc[:,0])\n",
    "    elif statecode == (10,1):\n",
    "        # 知道症状找病\n",
    "        symptom = list((question_key_words & symptom_known))[0]\n",
    "        query = \"\"\"\n",
    "        MATCH (Name:Name)-[:`症状`]->(symptom:symptom{name:$name}) RETURN Name.name;\n",
    "        \"\"\"\n",
    "        results = graph.run(query,name = symptom)\n",
    "        results = pd.DataFrame(results)\n",
    "        result = list(results.iloc[:,0])\n",
    "    elif statecode == (100,1):\n",
    "        # 知道药找病\n",
    "        drug = list((question_key_words & drug_known))[0]\n",
    "        query = \"\"\"\n",
    "        MATCH (Name:Name)-[:`治疗药物`]->(drug:drug{name:$name}) RETURN Name.name;\n",
    "        \"\"\"\n",
    "        results = graph.run(query,name = drug)\n",
    "        results = pd.DataFrame(results)\n",
    "        result = list(results.iloc[:,0])\n",
    "    elif statecode == (10,100):\n",
    "        # 知道症状找药\n",
    "        symptom = list((question_key_words & symptom_known))[0]\n",
    "        query_1 = \"\"\"\n",
    "        MATCH (Name:Name)-[:`症状`]->(symptom:symptom{name:$name}) RETURN Name.name;\n",
    "        \"\"\"\n",
    "        names = graph.run(query_1,name = symptom)\n",
    "        names = pd.DataFrame(names)\n",
    "        names = list(names.iloc[:,0])\n",
    "        result = pd.DataFrame(columns=['name', 'drug'])\n",
    "        for name in names:\n",
    "            query = \"\"\"\n",
    "        MATCH (Name:Name{name:$name})-[:`治疗药物`]->(drug:drug) RETURN drug.name;\n",
    "        \"\"\"\n",
    "            rs = graph.run(query,name = name)\n",
    "            rs = pd.DataFrame(rs)\n",
    "            rs.insert(0, 'new', name)\n",
    "            rs.columns = ['name', 'drug']\n",
    "            result = pd.concat([result,rs], axis=0, ignore_index=True)\n",
    "    return result"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-26T10:20:12.489832Z",
     "end_time": "2025-09-26T10:20:12.510797Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": 17,
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "=== 简单对话系统 ===\n",
      "（输入“再见”结束对话）\n",
      "机器：你好，我是初代智能医药助手，有什么问题欢迎问我 '-' \n",
      "用户： 头疼什么病\n",
      "机器： 问题答案就在下方的表格或者列表之中 \n",
      " ['颈椎病', '月经不调']\n",
      "用户： 再见\n",
      "机器：再见！\n"
     ]
    }
   ],
   "source": [
    "# 第三步，对话系统\n",
    "def simple_chat(graph,name_known,alias_known,symptom_known,drug_known,name_unknown,drug_unknown,symptom_unknown):\n",
    "    print(\"=== 简单对话系统 ===\")\n",
    "    print(\"（输入“再见”结束对话）\")\n",
    "    print(\"机器：你好，我是初代智能医药助手，有什么问题欢迎问我 '-' \")\n",
    "    while True:\n",
    "        user_input = input(\"你：\").strip()\n",
    "        print('用户：',user_input)\n",
    "        # 结束条件\n",
    "        if user_input == \"再见\":\n",
    "            print(\"机器：再见！\")\n",
    "            break\n",
    "        # 调试回复\n",
    "\n",
    "        result = get_match_result(graph,user_input,name_known,symptom_known,drug_known,name_unknown,drug_unknown,symptom_unknown)\n",
    "        output = '问题答案就在下方的表格或者列表之中'\n",
    "        print(\"机器：\",output,'\\n',result)\n",
    "\n",
    "if __name__ == \"__main__\":\n",
    "    initial()\n",
    "    data  = pd.read_csv('data/disease.csv')\n",
    "    data = data.fillna('无')\n",
    "    name_known,alias_known,symptom_known,drug_known,name_unknown,drug_unknown,symptom_unknown = get_match_dictionary(data)\n",
    "    simple_chat(graph,name_known,alias_known,symptom_known,drug_known,name_unknown,drug_unknown,symptom_unknown)"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "start_time": "2025-09-26T11:43:55.027547Z",
     "end_time": "2025-09-26T11:44:02.951035Z"
    }
   }
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "outputs": [],
   "source": [],
   "metadata": {
    "collapsed": false
   }
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 2
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython2",
   "version": "2.7.6"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 0
}
